AI资讯新闻榜单内容搜索-Gemma 4

端侧跑大模型，现在也太简单了

最近，我们都在关注旗舰级大模型的进步，其实本地运行的 AI 模型也迎来了重要的分水岭。

来自主题: AI技术研报

8299 点击 2026-06-24 16:58

谷歌Gemma 4 12B震撼发布！全球下载破1.5亿，16G轻薄本封神

刚刚，谷歌扔出Gemma 4 12B大杀器！16G轻薄本就能全离线流畅跑通，性能直逼26B巨兽，全体开发者惊呼太震撼了，平民级本地AI封神之作降临。硬核实测速来看！

来自主题: AI技术研报

8112 点击 2026-06-04 17:03

重磅！谷歌开源Gemma 4 12B：统一的、无编码器的多模态模型，16G内存笔记本就可以跑

刚刚，谷歌DeepMind发布了Gemma 4 12B。一句话概括这个模型的定位：把原本需要高端服务器才能跑的多模态智能，装进你的笔记本电脑里。它填补的是Gemma家族里一个关键空缺：比边缘端的E4B更强，比26B混合专家模型（MoE）更轻。而且在整个Gemma 4系列里，它是第一个支持原生音频输入的中等规模模型。

来自主题: AI资讯

10102 点击 2026-06-04 09:46

LLM近期重大架构进化一览：从Gemma 4到DeepSeek V4

过去一段时间，很多人对大模型都有一个明显感受：token 总是不够用。

来自主题: AI技术研报

7740 点击 2026-05-19 15:32

一张4090就能爆改！面壁智能MiniCPM-V 4.6开源，1B多模态卷出新高度

面壁智能正式发布并开源了 MiniCPM-V 系列新一代基础模型——MiniCPM-V 4.6。这款模型的整体参数规模仅约 1B（1.3B），是该系列有史以来参数规模最小的一款。但在多模态综合能力上，它却成功超越了被视为标杆的阿里 Qwen3.5-0.8B 和谷歌 Gemma 4 E2B-it，做到了「尺寸更小、效率更高、性能更好」。

来自主题: AI资讯

9842 点击 2026-05-13 11:57

只要24GB 内存，能在本地 Mac上跑无限制的Gemma 4 31B了

有个31B参数的大模型，正常需要80GB显存才能跑。但现在，24GB显存就能跑满血版。这个版本叫Gemma-4-31B-JANG_4M-CRACK——"CRACK"这个词不要理解歪了，它本质是量化压缩加上对齐微调之后的部署版本，不是什么黑客攻击，就是工程优化。24GB，MacBook Pro，直接跑。苹果用户优先优化，MLX原生支持，月下载13000次。

来自主题: AI资讯

9775 点击 2026-05-10 11:39

不改模型、不降质量，谷歌让Gemma 4快了3倍：本地跑大模型彻底变天

谷歌刚刚给Gemma 4家族更新了一项关键能力：Multi-Token Prediction（MTP）推测解码架构，推理速度最高提升3倍，输出质量不变。

来自主题: AI资讯

9796 点击 2026-05-06 14:56

iPhone本地跑Gemma 4火了，0 token时代还有多远？

一个 X 用户的帖子被围观数十万次。他在帖子里放了一个视频，讲述自己如何在 iPhone 上本地运行 Gemma 4，包括处理图片、音频、控制手电筒开关。他表示，Gemma 4 速度快得惊人，感觉像魔法一样。

来自主题: AI资讯

9311 点击 2026-04-06 13:53

谷歌Gemma 4深夜突降，31B爆杀20倍巨头！手机跑全血「龙虾」

谷歌深夜掏家底！Gemma 4全系开源，仅用31B越级斩杀20倍体量巨头。数学能力暴涨68%，硬生生把前代打成计量单位，开源界迎来终极大洗牌！

来自主题: AI资讯

10111 点击 2026-04-03 14:07

谷歌重磅开源Gemma 4！手机离线跑 Agent、还降内存，Qwen 被拉进正面对决

刚刚，谷歌正式发布 Gemma 4，称“这是其迄今为止最智能的开放模型系列”。该系列面向复杂推理与智能体工作流设计，采用商业许可的 Apache 2.0 许可证开源。Gemma 4 提供四种规格：Effective 2B（E2B）、Effective 4B（E4B）、26B 混合专家模型（MoE）和 31B 稠密模型（Dense）。

来自主题: AI资讯

10140 点击 2026-04-03 01:35